一个HelloWorld引出的故事
一、前言
近日在学校学完了汇编课程,练手之余发现了由VC6编译出obj文件与汇编联合编译时候引发的BUG,在解决的过程中再次发现另外两个BUG。此文由笔记整理而成,虽力求完美,却因小弟才疏学浅难免有不足之处,希望各位朋友点评,让小弟进步。
这篇笔记由初见BUG、ESP定律脱壳、重建导入表、调试分析inc2l、修复inc2l这几部分构成,笔记结构如下:
初见BUG
使用VC6编译出的obj文件与汇编联合编译。因VC6使用的kernel32.lib和masm32使用的kernel32.lib对GetEnvironmentStrings 这个函数的声明不一致引出第一个BUG.
修复masm32中 kernel32.INC 后,在使用工具inc2l将kernel32.inc 打包为 kernel32.lib 时,引出第二个BUG。(inc2l打包不成功,且没有任何提示)
ESP定律脱壳
在分析inc2l之前从查壳软件中得知inc2l加了压缩壳,使用ESP定律脱壳。
重建导入表
脱壳后,利用OD的Dump程序后,发现导入表已经被毁.使用工具impREC重建导入表引出了第三个BUG(impREC会添加新节(mackt)存放节表,有的样本新增节表的位置刚好超过了PE中的 SizeOfHeaders 所限定的大小。恰恰 ImpREC 并没有更新PE中的 SizeOfHeaders 的大小)(最新版 impREC1.7 依旧没有修复这个BUG)
分析Inc2l
经过分析,发现inc2l会取环境变量"mdir",如果取到则使用 "\bin\ml" 与 "bin\link"组合编译链接。如果没有取到环境,则使用缺省的"masm32\bin\ml 与 "masm32\bin\link"组合编译链接。但缺省的组合方式没有写明盘符,所以inc2l必须要和masm32在同一盘符下才能正常使用。
修复Inc2l
从上文得知了inc2l出错的由来,可知修复方案为:
新建环境变量"mdir"。
保证inc2l与masm32处在同一盘符下。
修改inc2l的二进制,将缺省的组合方式修改为ml.exe 和 link.exe编译链接。
二、环境
Microsoft Visual 6.0
RadASM
Win7 64bit
三.初见BUG
3.1 新建工程
使用VC新建控制台工程TestHello,编写函数ShowHello()。
使用RadAsm新建汇编控制台工程TestBug后,将C语言TestHello工程编译的Test.obj文件复制到TestBug目录下,并拖到工程中,如图1:
Link的时候提示两个错误,如图2:
3.2 Link错误一:缺少_Main符号
之所以提示缺少 _Main符号这个错误,是因为在我们的Test.obj里使用了Printr,而Printf的实现在LIBCD.LIB里。所以我们C语言工程在生成Test.obj的时候将LIBCD.LIB一起Link.而在LIBCD.LIB里由一个ctr0.obj,其中包含了VC6的入口代码。我们可以用IDA或者桟回溯来验证猜想。
3.2.1 IDA验证缺少_Main符号原因
将LIBCD.LIB(LIBCD.LIB在VC6安装目录 > VC98 > LIB中)复制到桌面(因权限问题本人在安装目录下打开失败,所以将其复制到桌面打开)如图3。
双击crt0.obj进去,会看到入口代码,如图4
向下翻,会执行一些初始化的工作,如图5.
3.2.2 栈回溯验证缺少_Main符号原因
打开VC工程,通过栈回溯窗口进入 WinMainCRTStartup 函数中。
在 WinMainCRTStartup 函数中会进行一些初始化的工作,如根据字符集选择A版或者W版的获取环境变量函数。最后根据条件编译调用wmain或者是main(如图6)
3.2.3 解决错误一:缺少_Main符号
由上可知是因为Link了LIBCD.LIB,而LIBCD.LIB中又由入口函数被LINK。但拷贝到RadAsm工程中的Test.obj并没有定义入口函数,缺少一个main的实现。而Link的流程又需要调用main符号。基于此,只要能检测到main符号,就能解决掉这个错误。有两个解决方案:
解决方案一:定义main的空函数(如图7)
解决方案二:将工程中的程序入口点改为main(如图8)
3.3 Link错误二:GetEnvironmentStrings
Link时的第二个错误提示没找到 GetEnvironmentStrings 函数实现,而GetEnvironmentStrings 的实现在在 kernel32.lib 这个库中。
下面分别去看看VC6与 RadASM 使用 GetEnvironmentStrings 这个函数的声明。
VC6使用的kernel32.lib库路径 : VC6安装目录/VC98/Lib/
RadASM使用的kernel32.lib库路径 : masm32/Lib
3.3.1 ReadAsm -> GetEnvironmentStrings函数声明
RadASM使用的 GetEnvironmentStrings 函数声明位于masm32 的 include目录下的 kernel32.inc 中(如图9)
如果定义了 UNICODE
则用GetEnvironmentStrings 替换GetEnvironmentStringsW.
(GetEnvironmentStrings是宏,GetEnvironmentStringsW是真正的函数名.)
如果没定义了 UNICODE
则用GetEnvironmentStrings 替换GetEnvironmentStringsA.
(GetEnvironmentStrings是宏,GetEnvironmentStringsA是真正的函数名.)
3.3.2 VC6 -> GetEnvironmentStrings函数声明
如果定义了 UNICODE
则用GetEnvironmentStrings 替换GetEnvironmentStringsW.
(GetEnvironmentStrings是宏,GetEnvironmentStringsW是真正的函数名.)
如果没定义 UNICODE
则用GetEnvironmentStringsA 替换GetEnvironmentStrings.
(GetEnvironmentStringsA是宏,GetEnvironmentStrings是真正的函数名.)
3.3.3 分析结论
通过对比,我们发现了masm32与微软VC6对 GetEnvironmentStrings 这个函数声明不一致导致上文链接错误。那么这个锅该谁背呢?大部分人都会认为微软是巨头,潜意识中都认为以微软为标准,这个错误是masm32的锅。我们再看看微软声明的其他API,看看微软定义API时的风格,如MessageBox(如图11)
如果定义了 UNICODE
则用MessageBoxW 替换 MessageBox.
(MessageBox是宏,MessageBoxW是真正的函数名.)
如果没定义 UNICODE
则用MessageBoxA 替换 MessageBox.
(MessageBox是宏,MessageBoxA是真正的函数名.)
微软声明的API时大部分情况下都以带W或者带A后缀为函数名,偏偏声明 GetEnvironmentStrings 却相反。所以谁的锅,真不好说。
3.3.4 解决错误二: GetEnvironmentStrings
既然发现问题是出于masm32与VC6对 GetEnvironmentStrings 函数声明不一致导致的错误,那么我们将masm32中的函数声明修改与VC6中的函数声明一致,是不是就能解决问题了呢?(修改前记得备份,惨痛的教训…)(如图12)
修改后保存,再次Link,却依旧报错。因为因为masm32中已经根据没修改前的kernel32.inc打包成kernel32.lib了。我们必须重新将修改后的kernel32.inc打包,再替换。
3.4 inc转lib工具inc2l
在 masm32/tools/inc2l 中提供了打包工具 inc2l.exe.(inc:头文件扩展名 | 2:谐音 to | l:lib ),从inc转成lib文件格式。
将inc2l.exe与修改后的 kernel32.inc 文件拷贝到 D:\Tool,用命令行运行(如图13)
并没有如愿生成我们所期待的kernel32.lib.好吧,那下面动手分析下为什么没有产生lib文件吧。
分析之前习惯性的用用Exeinfo查壳,发现程序加了PEcompact壳.ESP定律手动脱壳几乎通杀全部于压缩壳和部分加密壳(前提是无对抗)(如图14)
四、ESP定律脱壳
一般的加壳程序的入口处有保存环境的代码,因为要跳到OEP(入口点称为EP,原始入口点称为OEP),势必要在它恢复代码后还原环境,否则会产生不兼容。一般都会将寄存器环境保存到桟中。所以很多壳在程序的伪入口点会看到push之类的代码,就是为了保存环境,那么等它push后,我们找到栈顶的位置,在壳恢复环境时,肯定会读。
于是乎,我们找到了脱壳的通用思路,我们通过它保存环境的第一个push。一旦它push后,栈顶保存了初始寄存器的内容。找到栈顶的内存位置,下硬件访问断点。等它读这个数据的时候,那么就离还原寄存器环境很近了。还原完寄存器环境后,就开始跳OEP了。
4.1 OD定位OEP
载入OD(如图15)
push eax,F8单步步过这条指令(PUSH后,可看到ESP和EIP数值变化了 ESP定律中,其实变化的只有子模块)(如图16)
选中ESP,右键>数据窗口跟随(如图17)
下硬件访问断点,因为它保存了环境,势必会在它恢复代码后还原环境。(如图18)
按F9,注意下方触发的断点,直到断在主模块。(如图19)
上下翻动,找回复环境的JMP(一般还原代码后都会有个jmp跳回OEP)(如图20)
在JMP处下断点,并取消刚才下的硬件断点(如图21)
F7单步过去,回到OEP(如图22)
4.2 Dump脱壳
右键 ->OllyDumpEx -> Dump 保存为inc2l_dump.exe(如图23)
双击脱壳后的程序,运行后却C05异常。这是因为是因为脱壳后IAT还没填写就被dump了(导入表有一部分被毁掉了)(如图24)
还原的思路:因为dump后程序导入表被毁掉了,所以得重建导入表。因此得根据脱壳前程序的导入表还原脱壳后程序的导入表.OD载入inc2l.exe。走到已经被填充IAT的位置,记下IAT的起点与终点(如图25,26)
IAT表起点:0x00408050 IAT表终点:0x0040823F 快大小:0x1F0
得到IAT表起点和终点还有IAT表大小后,写个自动化程序,取出其中每一个地址,由写的程序自动识别是哪个函数哪个库,这些信息一旦获取,就可以重新建立一个新的导出表。庆幸的是,这个工具已经有人写出来了,就是impREC。
五、impREC重建导入表
用OD载入inc2l.exe(Dump前的程序),在impREC中附加进程(之前Win7中一直找不到inc2l.exe的活动进程,感谢张老师的提示,权限问题,右键管理员运行impREC即可)(如图27)
5.1 impREC自动定位IAT表信息
当然impREC也有自动搜索的功能,但貌似不是很精准。所以,建议手动定位IAT表信息再填写(如图28)
5.2 获取IAT表信息
上文获取到的信息:IAT表起点:0x00408050 IAT表终点:0x0040823F 快大小:0x1F0,填写后Get Imports获取IAT表信息。(如图29)
5.3 重建导入表
点击Fix Dump,选择脱壳后的程序inc2l_dump.exe,根据采集的IAT信息重建导入表。成功后同目录下会多出inc2ldump.exe文件。
但却依然没有正常运行,报错 (0x0000007b),这个错误是PE格式的问题。用WinHex打开查看PE结构,发现impREC会添加新节(mackt)存放节表,有的样本新增节表的位置刚好超过了此样本PE中的SizeOfHeaders所限定的大小(200)。恰恰ImpREC并没有更新PE中的 SizeOfHeaders 的大小,估计大多数样本SizeOfHeaders都超过了200。(如图30)
将 SizeOfHeaders 修改成1000以下200以上并且为200的倍数即可。(如图31)
六、分析修复inc2l
这是控制台程序,需要带命令行参数。一开始直接载入OD才发现是浪费时间,加上参数后再调试。
6.1 分析inc2l
该程序会生成LIB文件,而一般生成Lib文件需要中间文件的支持.因此必然要进行文件操作(当然不排除变态的做法)。因此我们在CreateFileA,CreateFileB(因为不知道调用的是A版还是W版,所以干脆都下断点),ReadFile,WriteFile,然后F9运行。
打开Kernel32.inc.文件句柄为 0x0000007C。(如图32,33)
读取Kernel32.inc.(如图34)
创建kerenel32.def.文件句柄为 0x00000080.(如图35,36)
创建kerenel32.asm.文件句柄为 0x00000084.(如图37,38)
多次往Kernel32.asm写数据代码.(如图39)
往kerenl32.def写代码。(如图40)
目录下创建了kernel32.asm和kernel32.def文件,并且写入很多数据.(图41)
根据以上行为分析:读inc,写asm,def文件.按照一般思路,有了asm,def文件,想要生成lib,一般都会使用微软提供的ml/cl程序(至少我是这样的)。如果在程序调用这些程序,那么应该会有CreateProcess来创建进程。因此,我们在CreateProcessA,CreateProcessW来创建进程。(如图42,43,44)
为了查看详细的错误代码,我们写个DEMO程序,模拟inc2l的CreateProcess,输出错误原因。
void ShowErrorMsg();
int main(int argc,char *argv[])
{
char szCommandLine[] = "\\masm32\\bin\\ml /c /coff kernel32.asm";
STARTUPINFO si = { sizeof(si) };
PROCESS_INFORMATION pi;
si.dwFlags = STARTF_USESHOWWINDOW; //指定wShowWindow成员有效
si.wShowWindow = TRUE; //此成员设为TRUE的话则显示新建进程的主窗口
BOOL bRet = CreateProcess(
NULL, //不在此指定可执行文件的文件名
szCommandLine, //命令行参数
NULL, //默认进程安全性
NULL, //默认进程安全性
FALSE, //指定当前进程内句柄不可以被子进程继承
NORMAL_PRIORITY_CLASS,
NULL, //使用本进程的环境变量
NULL, //使用本进程的驱动器和目录
&si,
&pi
);
if (bRet)
{
CloseHandle(pi.hThread);
CloseHandle(pi.hProcess);
}
else
{
ShowErrorMsg();
}
system("pause");
return 0;
}
void ShowErrorMsg()
{
LPVOID lpMsgBuf;
FormatMessage(
FORMAT_MESSAGE_ALLOCATE_BUFFER |
FORMAT_MESSAGE_FROM_SYSTEM |
FORMAT_MESSAGE_IGNORE_INSERTS,
NULL,
GetLastError(),
MAKELANGID(LANG_NEUTRAL, SUBLANG_DEFAULT), // Default language
(LPTSTR)&lpMsgBuf,
0,
NULL
);
MessageBox(NULL, (LPCTSTR)lpMsgBuf, TEXT("Error"), MB_OK | MB_ICONINFORMATION);
LocalFree(lpMsgBuf);
}
将生成的程序拷贝到inc2l_dump.exe同目录下,发现错误原因系统找不到指定文件。(如图45)
是不是CreateProcess中路径参数 \masm32\bin\ml 的错误呢,将DEMO程序中的路径换成相对路径再试试。再将DEMO程序和kernel32.asm,拷贝到\masm32\tools\inc2l 目录下运行。运行正常还生成了obj文件。(如图46,47)
经过测试,相对路径错误,绝对路径正确。那么说明是环境变量的问题。猜想inc2l中是不是需要哪个环境变量指向\masm32\bin里呢。抱着疑问,我们继续回到OD调试,通过桟回溯找到取环境变量的位置。(如图48)
有两个跳转,拼接的命令行参数不同。(如图49,50)
大致跟进去查看后,猜测大致流程如下图(天生艺术细胞不强,凑合着看吧):(如图51)
既然是因为取环境变量"mdir",而我们又没有这个环境变量。那是不是加上了环境变量就正常了呢。加个环境变量测试下,(如图52,53)
6.2 分析总结
执行流程
打开读取参数文件。
创建参数.def文件和参数.asm文件。
根据参数写 参数.def文件和 参数.asm文件。
取环境变量"mdir",如果取到则和 "\bin\ml" 与 "bin\link"组合编译链接.如果没有取到环境,则用默认的"masm32\bin\ml 与 "masm32\bin\link"组合编译链接。
因为默认的没有盘符,所以inc2l.exe必须与masm32处于同一盘下才能正常使用。之前我们将inc2l.exe复制到D盘,而masm32安装在C盘,因此没有正确打包成LIB文件。
为了验证我们的猜想,我们将 "mdir" 环境变量删除,并在inc2l_dump.exe所在的D盘根目录新建文件夹masm32,在d:\masm32中新建文件夹bin,并且将ml.exe | link.exe拷贝其中,再尝试编译。(如图54)
我们已经从上实验中得知,之所以没有打包成功,是因为编译链接时候找不到ml.exe 与 link.exe。而我们在安装VC6和masm32后,已经把,ml.exe 与link.exe加入环境变量中(如图55)
那么我们在inc2l_dump.exe没有取到环境变量"mdir", 则直接使用ml.exe 和 link.exe 编译链接呢?(即将"masm32\bin\ml 与 "masm32\bin\link" 修改为 "ml" 与 "link").OD中看到默认的"masm32\bin\ml 与 "masm32\bin\link" 全局字符串,那么我们打开WinHex定位到此处。(如图56)
注意,此处用的是Pascal,前4字节所以放长度,后面放字符串 0结尾。所以修改时注意。(如图57)
此时再使用inc2l即可正常将inc文件打包成lib文件。(如图58)
总结修复方案
1.设置环境变量"mdir"
2.保证inc2l.exe与masm32处在同一盘下。
3.修改inc2l.exe二进制,直接使用ml.exe link.exe编译链接。
其实这个环境变量的问题也不好认定是否是BUG,说它是Bug,它在帮助里给出了提示,指出了要依赖环境变量mdir。但说它不是BUG,这提示藏得有点深,一般人机子上都不会默认有mdir这个环境变量吧,而且如果因为路径原因调用ml.exe和link.exe失败,至少得给个提示吧,因为XXX原因生成失败...这直接就是空白无任何提示,用户体验相当不好啊。
七、Hello World
将打包好的kernel32.lib替换C:\masm32\lib\kernel32.lib.(如图59)
尝试编译链接已经成功,但运行依旧出问题。(如图60)
这是因为我们给RadAsm提供的.obj是VC环境下编译的,因此对应的入口函数也应该改为mainCRTStartup。(如图61)
运行编译出的EXE,久违的Hello World,终于出来了(如图62)
本文由看雪论坛 韩逸 原创
转载请注明来自看雪社区
往期热门阅读:
点击阅读原文/read,
更多干货等着你~
扫描二维码关注我们,更多干货等你来拿!